6 research outputs found

    Clustering par apprentissage de distance guidé par des préférences sur les attributs

    No full text
    National audienceCes dernières années de nombreuses méthodes semi-supervisées declustering ont intégré des contraintes entre paires d’objets ou d’étiquettes declasse, afin que le partitionnement final soit en accord avec les besoins de l’utilisateur.Pourtant dans certains cas où les dimensions d’études sont clairementdéfinies, il semble opportun de pouvoir directement exprimer des contraintessur les attributs pour explorer des données. De plus, une telle formulation permettraitd’éviter les écueils classiques de la malédiction de la dimensionnalitéet de l’interprétation des clusters. Cet article propose de prendre en compte lespréférences de l’utilisateur sur les attributs afin de guider l’apprentissage de ladistance pendant le clustering. Plus précisément, nous montrons comment paramétrerla distance euclidienne par une matrice diagonale dont les coefficientsdoivent être au plus proche des poids fixés par l’utilisateur. Cette approche permetd’ajuster le clustering pour obtenir un compromis entre les approches guidéespar les données et par l’utilisateur. Nous observons que l’ajout des préférencesest parfois essentiel pour atteindre un clustering de meilleure qualité

    Efficient Constraint Validation for Updated XML Databases

    No full text
    XML constraints are either schema constraints representing rules about document structure (e.g. a DTD, an XML Schema definition or a specification in Relax-NG), or integrity constraints, which are rules about the values contained in documents (e.g. primary keys, foreign keys, etc.). We address the problem of incrementally verifying these constraints when documents are modified by updates. The structure of an XML document is a tree, whose nodes are element (or attribute) names and whose leaves are associated to values contained in the document. Considered updates are insertion, deletion or replacement of any subtree in the XML tree. Schema constraints are represented by tree automata and tree grammars. Key and foreign key constraints are represented by attribute grammars, adding semantic rules to schema grammars, to carry key and foreign key values (to verify their properties). Our incremental validation tests both schema and integrity constraints while treating the sequence of updates, in only one pass over the document. Only nodes involved in updates trigger validation tests. An analysis of complexity shows that worst cases are determined by the shape of the XML tree being processed (asymptotic upper bounds are presented). Experimental results show that our algorithms behave efficiently in practice
    corecore